hassas saldırı ne demek?

Hassas saldırı (Sensitivity Attack), bir makine öğrenimi modelinin kararlarını etkileyebilecek, modelin eğitim verilerinde yer alan hassas özniteliklere (örneğin, ırk, cinsiyet, din gibi) bağımlı hale gelmesine neden olan bir tür önyargı saldırısıdır. Saldırganlar, bu tür hassasiyetleri tespit edip kötüye kullanarak modelin adil olmayan veya ayrımcı sonuçlar üretmesine yol açabilirler. Bu durum, özellikle karar alma süreçlerinde kullanılan makine öğrenimi modellerinde ciddi etik ve sosyal sorunlara yol açabilir. Hassas saldırılar, veri zehirlenmesi veya model çıkarma gibi farklı tekniklerle gerçekleştirilebilir.